TimeSeries Partitioning是大多数机器学习驱动的传感器的IOT应用程序的重要步骤。本文介绍了一种采样效率,鲁棒,时序分割模型和算法。我们表明,通过基于最大平均差异(MMD)的分割目标来学习特定于分割目标的表示,我们的算法可以鲁布布地检测不同应用程序的时间序列事件。我们的损耗功能允许我们推断是否从相同的分布(空假设)中绘制了连续的样本序列,并确定拒绝零假设的对之间的变化点(即,来自不同的分布)。我们展示了其在基于环境传感的活动识别的实际IOT部署中的适用性。此外,虽然文献中存在许多关于变更点检测的作品,但我们的模型明显更简单,匹配或优于最先进的方法。我们可以平均地在9-93秒内完全培训我们的模型,而在不同应用程序上的数据的差异很小。
translated by 谷歌翻译
命名实体识别(NER)任务旨在识别属于人,位置,组织等预定语义类型的文本中的实体。平面实体的最新解决方案NER通常因捕获捕获基础文本中的细粒语义信息。现有的基于跨度的方法克服了这一限制,但是计算时间仍然是一个问题。在这项工作中,我们提出了一个基于跨度的新型NER框架,即全球指针(GP),该框架通过乘法注意机制来利用相对位置。最终目标是实现一个全球观点,以考虑开始和最终位置以预测实体。为此,我们设计了两个模块来识别给定实体的头部和尾部,以使训练和推理过程之间的不一致。此外,我们引入了一种新型的分类损失函数,以解决不平衡标签问题。在参数方面,我们引入了一种简单但有效的近似方法来减少训练参数。我们在各种基准数据集上广泛评估GP。我们的广泛实验表明,GP可以胜过现有的解决方案。此外,实验结果表明,与软马克斯和熵替代方案相比,引入的损失函数的功效。
translated by 谷歌翻译
在深度学习时代,损失功能决定了模型和算法可用的任务范围。为了支持深度学习在多标签分类(MLC)任务中的应用,我们建议在本文中ZLPR(基于零结合的log-sum-exp \&成对级别)损失。与MLC的其他基于等级的损失相比,ZLPR可以治疗目标标签数量不确定的问题,在这种角度,这使其与MLC经常使用的其他两种策略同样能够,即二进制相关性(即二进制相关性)( BR)和标签Powerset(LP)。此外,ZLPR考虑了标签之间的加成,这使其比BR方法更全面。就计算复杂性而言,ZLPR可以与BR方法竞争,因为其预测也与标签无关,这使得与LP方法相比,时间和内存所需的时间和内存少。我们的实验证明了ZLPR对多个基准数据集和多个评估指标的有效性。此外,我们提出了ZLPR的软版本和相应的KL-Diverengency计算方法,这使得可以应用一些正则化技巧,例如标签平滑,以增强模型的概括。
translated by 谷歌翻译